شناسایی ژن های موثر در بروز بیماری با استفاده از داده کاوی ریزآرایه و آنتولوژی ژن

پایان نامه
چکیده

امروزه استفاده از اطلاعات ژنتیکی افراد در تشخیص و رده بندی انواع بیماری ها از جمله سرطان ها، مورد توجه قرار گرفته است. یکی از بهترین و دقیق ترین روش ها در این زمینه، بررسی مقادیر بیان ژنی در افراد مختلف توسط فناوری ریزآرایه می باشد. یکی از مشکلات داده های ریزآرایه کم بودن تعداد نمونه ها در مقایسه با تعداد ژن ها است. این مسیله سبب کاهش دقت رده بندی و افزایش هزینه های محاسباتی و آزمایشگاهی می شود، در عین حال بسیاری از این ژن ها در ایجاد بیماری مورد بررسی نقشی ندارند، در نتیجه تشخیص و انتخاب ژن های موثر در بروز بیماری علاوه بر آنکه سبب افزایش دقت رده بندی وکاهش هزینه ها می شود، از نظر زیستی نیز از اهمیت ویژه ای برخوردار است و می تواند اطلاعات مفیدی درباره علل و نحوه درمان بیماری ها در اختیار محققین قرار دهد. تشخیص و انتخاب ژن های موثر در بروز بیماری، از میان هزاران ژن مورد بررسی در آزمایش ریزآرایه، انتخاب ژن نام دارد. در این پایان نامه با بررسی روش های مختلف انتخاب ژن، تلاش شده است با بهره گیری از مزایای روش های موجود، چارچوب جدیدی برای انتخاب ژن های موثر در بروز بیماری ارایه شود، به نحوی که نقاط ضعف روش های متداول پوشش داده شوند. در روش پیشنهادی، علاوه بر داده های بیان ژنی از یکی دیگر از منابع معتبر موجود درباره ژن ها یعنی آنتولوژی ژن نیز کمک گرفته شده است. استفاده از آنتولوژی ژن در کنار مجموعه داده های بیان ژنی تا حدی می تواند محدودیت های ریزآرایه یعنی کم بودن تعداد نمونه ها و خطای احتمالی در مقادیر اندازه گیری شده را جبران نماید. در چارچوب ارایه شده ابتدا بخش عمده ای از ژن های غیرمرتبط با کمک روش فیلتری (فیشر) حذف می شوند، اما روش های فیلتری همبستگی موجود بین ژن ها را مدنظر قرار نمی دهند در نتیجه ژن های باقیمانده دارای حجم بالایی از افزونگی می باشند. به منظور کاهش افزونگی در ژن های باقیمانده، یک رویکرد حریصانه برای حذف ژن های مشابه پیشنهاد شده است. در این رویکرد میزان مشابهت ژن ها با در نظر گرفتن اطلاعات آنتولوژی ژن و داده های بیان ژنی و بر اساس یک معیار تلفیقی محاسبه می شود و سپس بر اساس این معیار، ژن های افزونه از مجموعه ژن ها حذف می شوند. در نهایت ژن های باقیمانده از این مرحله، به عنوان ژن های کاندید به طور دقیق تر توسط روش svmrfe مورد بررسی قرار می گیرند تا مجموعه ژن های نشانگر بیماری بدست آید. روش پیشنهادی بر روی دو مجموعه داده سرطان dlbcl و سرطان کلون اعمال شده است. نتایج بدست آمده نمایانگر تاثیر مثبت روش پیشنهادی بر کارایی رده بندی است، به علاوه مقایسه این روش با روش های انتخاب ژن متداول، نشان می دهد که روش ارایه شده به ازای تعداد ژن های مساوی، از کارایی بهتری برخوردار است. همچنین از آنجایی که بسیاری از مجموعه داده های ریزآرایه به دلایل مختلف از جمله وجود خراش یا گرد و غبار بر روی اسلاید، بروز خطا در حین آزمایش، اختلال در تصویر ریزآرایه و پایین بودن قدرت تفکیکی تصاویر، شامل مقادیر گمشده می باشند در این پایان نامه با استفاده از تلفیق روش خوشه بندی cst و آنتولوژی ژن روش نوینی برای تخمین مقادیر گمشده در مرحله پیش پردازش ارایه گردیده است. عملکرد روش پیشنهادی بر روی مجموعه داده سرطان dlbcl و به ازای درصدهای مختلفی از مقادیر گمشده مورد بررسی قرار گرفته است. مقایسه نتایج حاصل از روش پیشنهادی با نتایج سایر روش های تخمین مقادیر گمشده، نشان می دهد که روش پیشنهادی می تواند مقادیر گمشده را با دقت بالاتری تخمین بزند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

شناسایی ژن های موثر در بروز بیماری آلزایمر در مراحل اولیه با ابزار داده کاوی

بیماری آلزایمر یکی از شکل های جنون در دوره ی پیری است، این بیماری ازجمله بیماری های غیرقابل درمانی است که به طورمعمول در دهه های هفتم عمر انسان علائم خود را نشان می دهد. این بیماری ممکن است، سال ها بدون بروز علائم در بدن فرد وجود داشته باشد. با توجه به انجام تحقیقات بسیار زیاد بر روی این بیماری همچنان علل بروز آن مجهول مانده است. بیماری آلزایمر یا بر اساس توارث و یا به طور اتفاقی در فرد مسن ایج...

15 صفحه اول

تعیین عوامل موثر در بروز سرطان معده با استفاده از رویکرد داده کاوی

Background and Aim: Gastric cancer is the second leading cause of cancer death in the world. Due to the prevalence of the disease and the high mortality rate of gastric cancer in Iran, the factors affecting the development of this disease should be taken into account. In this research, two data mining techniques such as Apriori and ID3 algorithm were used in order to investigate the effective f...

متن کامل

شناسایی و دسته بندی ژن های موثر در سرطان (سرطان ریه) با استفاده از داده های ریزآرایه

امروزه باتوجه به گسترش روزافزون اطلاعات و پیشرفت¬هایی که در زمینه¬های پزشکی صورت گرفته است، استفاده از روش¬هایی که بتوان سرعت انجام کار و دقت را افزایش و هزینه آزمایش¬ها را کاهش داد؛ امری غیرقابل اجتناب است. با استفاده از تکنولوژی ریزآرایه¬ها می¬توان میزان بیان چندین هزار ژن را اندازه گرفت. از چالش¬هایی که برای تجزیه و تحلیل داده¬های ریزآرایه با آن روبرو هستیم، تعداد زیاد ژن¬ها در این مجموعه دا...

تشخیص لوسمی لنفوسیتی و میلوئیدی حاد با استفاده از انتخاب ژن داده‌های ریز‌آرایه و الگوریتم‌های داده کاوی

چکیده سابقه و هدف تکنولوژی ریزآرایه، یک تصویر کلی از میزان بیان هزاران ژن به طور هم زمان ارایه می‌دهد. تفسیر داده‌های ریز آرایه بدون آنالیز آماری و روش‌های هوش مصنوعی ممکن نیست. هدف این مقاله، تشخیص انواع لوسمی حاد با استفاده از مجموعه داده‌های ریز آرایه و الگوریتم‌های داده ‌کاوی بود. مواد و روش‌ها در این مطالعه توصیفی از داده‌های بیان 7129  ژن مربوط به 72 بیمار مبتلا به لوسمی استفاده شد. سپس ...

متن کامل

انتخاب ژن و طبقه بندی سلول های سرطانی بر پایه داده های ریزآرایه با استفاده از الگوریتم ترکیبی BPSO و BLDA

داده های ریزآرایه در تشخیص و طبقه بندی انواع بافت های سرطانی نقش بسزایی دارند. در پژوهش های سرطان همیشه تعداد نسبتا کم نمونه ها در ریزآرایه باعث ایجاد مشکلاتی در طراحی طبقه بندها شده است. بنابراین داده های ریزآرایه قبل از طبقه بندی از طریق تکنیک های انتخاب ژن پیش پردازش و ژن های فاقد اطلاعات آن ها دور ریخته می شود. اساسا یک روش انتخاب ژن مناسب می تواند بطور موثر کارایی دسته بندی بیماری ها (سرطا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023